AWS Auto Scaling
from AWS|WebアプリをAWSで公開しよう
from AWS SAA学習ログ|Ping-tを活用して本番試験に慣れる 2024/7/9
質問.icon AWS Auto Scalingとは?
アプリケーションの負荷に応じて自動的にインスタンス数を増減させることで、システムのパフォーマンスとコスト効率を最適化させるための技術
システムの負荷や需要の変動に応じて、自動的にコンピューティングリソース数を増減させることができる
システムがスケーラブルで高可用性を保ちながら、コスを最適化することができる
トラフィックの増加によってサーバーの負荷が上昇した場合、自動的に新しいサーバーを起動して負荷を分散し、応答時間を維持し、需要が低下した場合は、不要なサーバーを自動的に停止してコストを節約する
質問.iconAuto Scalingグループの主な設定項目は?
table:設定項目
項目 説明
希望容量 Auto Scalingグループで稼動するリソース数
最小キャパシティ Auto Scalingグループで稼動するリソースの最小数
最大キャパシティ Auto Scalingグループで稼動するリソースの最大数
ターゲットグループ Auto Scalingグループに紐付けるELBのターゲットグループ
ヘルスチェックタイプ ELBのヘルスチェックと、EC2のステータスチェック
ヘルスチェックの猶予期間 インスタンスが起動してから初回のヘルスチェックまでの待機時間
インスタンスの保護 スケールインが発生した時に削除対象から除外する
終了ポリシー スケールインが発生した時に、リソースを削除する優先順位
質問.iconスケーリングポリシーとは?
動的スケーリング
シンプルスケーリング
ステップスケーリング
ターゲット追跡スケーリング
スケジュールに基づくスケーリング
定期的なスケジュールでスケーリングを実施する
予測スケーリング
過去のパフォーマンスデータから未来のリソース需要を予測し、最適なリソース数になるようにスケーリングする
手動スケーリング
ユーザーが手動でスケーリングを実施する
質問.iconスケールアウトが発生した時に起動するリソースはどのように設定するか?
Auto scalingの起動テンプレートで設定する
質問.iconAuto Scalingのヘルスチェックの設定
Auto Scalingのヘルスチェックには、リソースがEC2インスタンスの場合「EC2」と「ELB」のオプションがある
EC2:インスタンスのステータスチェックの結果を確認する
ELB:指定した接続先への応答を確認する
「EC2」が有効「ELB」が無効になっている場合
ELBからのヘルスチェックに応答がないインスタンスは負荷分散先からは除外されるが、EC2のステータスチェックが正常であればインスタンスは起動した状態が続く
インスタンスが起動した状態だと新規インスタンスが起動しないため、最小キャパシティ未満のインスタンスで負荷分散することがある